練習 - 股票資料彙整_Yahoo股市 - 問題


In [1]:
page = 1
url = 'https://tw.stock.yahoo.com/s/list.php?c=tse&pid=' + str(page)
url


Out[1]:
'https://tw.stock.yahoo.com/s/list.php?c=tse&pid=1'

目標:

  • 使用 Pandas,抓取上述 url 網頁中的股價資料
  • 將股票代號與名稱區隔為不同的欄位
  • 將資料儲存為 Excel 檔案
  • 須注意個欄位的格式,數字欄位的儲存格式應該為數字
  • 重排欄位順序為:'市場別', '股票代號', '股票名稱', '日期', '時間', '成交', '買進', '賣出', '漲跌', '張數', '昨收', '開盤', '最高', '最低'
  • Extra:
    • 匯集 Yahoo 股市 page 1~ 5 的資料 (pd.concat)
    • 依據股票代號的前兩碼,做 GroupBy 操作
      • merge ../data/個股_類別.xls(先解壓縮 個股_類別.rar) 中的資料之後,做 GroupBy 操作

In [ ]: